Estimación de cambios en el número reproductivo efectivo \(R_t\)

  • Datos a partir de los reportes del Ministerio de Salud

El valor de \(R_t\) representa el número esperado de casos secundarios que surgen de un caso primario infectado en el momento \(t\). Este valor cambia a lo largo de un brote. Si el valor de \(R_t\) permanece por debajo de uno, el brote se extinguirá. Sin embargo, cuando \(R_t\) es mayor que uno, es probable que se produzca un brote sostenido. El objetivo de las intervenciones de control es típicamente reducir el número de reproducción por debajo de uno (Thompson et al. 2019).

Método de estimación aplicado (A. Cori et al. 2013; Thompson et al. 2019) permite la inclusión de los casos importados y que se puede estimar el intervalo serial a partir de seguimiento de casos y también incluir variablidad en la distribucion del intervalo serial cuando se asume una distribución gamma discreta.

  • Un parametro importante es el ‘Serial interval’ (SI). El SI es el tiempo entre el inicio de los síntomas de cada caso de la enfermedad en cuestión, y el inicio de los síntomas en cualquier caso secundario que resulte de la transmisión de los casos primarios. En otras palabras, es el tiempo entre casos en la cadena (de ramificación) de transmisión de la enfermedad. El SI es, de hecho, una distribución estadística de tiempos de intervalo en serie, en lugar de un valor fijo. Esa distribución se puede simular, generalmente utilizando una distribución gamma discreta con una media y desviación estándar dada.

  • Se utilizó un ‘Serial interval’ (SI) estimado por Q. Li et al. (2020) basado en 16 casos es de 7.5 días, con una SD=3.4, pero se permitió que la media del SI variara entre 2.3 y 8.4 usando una distribución normal truncada con una SD de 2.0, y tambien variamos la SD de la SD que variara entre 0.5 y 4.0

  • Luego se estimó el intervalo serial basandose en los datos de He et al. (2020) (77 casos), con una media estimada en su paper de 5.8 días, aunque esta dentro de los parámetros del punto anterior estos datos serían más realistas.

Variación en el intervalo serial

  • Usamos los datos de He et al. (2020) (77 casos) para estimar el intervalo serial (SI media de 5.8) y el \(R_t\), hay que eliminar el par con ID=9 porque el infector y el infectado suceden el mismo día. Estos datos consisten en la fecha de inicio de los síntomas en casos primarios y la fecha de inicio de síntomas en casos secundarios (originados por los primarios)

La mediana del intervalo serial estimado es mu =6.6944741 y la desviación sigma =4.4140809, lo cual es diferente de lo reportado en el paper de He et al. (2020) seguramente debido a que se usaron diferentes métodos. De ahora en adelante usaremos el intervalo serial estimado por nosotros.

Estimaciones usando modelos log-lineales

La fase inicial de un brote, cuando se muestra en un gráfico de semi-log (el eje y con una transformación logarítmica), aparece (algo) lineal. Esto sugiere que podemos modelar el crecimiento y decaimiento epidémico, utilizando un modelo log-lineal simple de la forma:

\[log(y) = rt + b\]

donde \(y\) es la incidencia, \(r\) es la tasa de crecimiento, \(t\) es el número de días desde un punto específico en el tiempo (generalmente el inicio del brote) y \(b\) es la ordenada de origen. Se ajustan modelos separados para distintas fases de la curva de epidemia (datos de incidencia).

  • Dividimos la curva de incidencia en dos partes, antes y despues del primer pico de incidencia que sucedió despues de la cuarentena (20/03/2020), que resultó el 30/03/2020. Tomamos esta fecha para determinar el \(R_0\) antes de la cuarentena

Estimamos con los casos locales (no importados) para toda Argentina

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.25 (95% CI 0.20 - 0.31)

  • La tasa de crecimiento después el pico fue 0.045 (95% CI 0.0474 - 0.043).

  • El tiempo de duplicacion de la primer parte es es 2.8 días (95% CI 2.3 - 3.5 días)

  • El tiempo de duplicación de la segunda parte 15.3 días (95% CI 14.6 - 16.1 días).

Proyecciones de incidencia para el total de casos Argentina

  • Esta estimación de proyecciones requiere la estimación del R0 para las dos fases que definimos (con division en el primer pico después de la cuarentena 2020-03-30), basado en (Nouvellet et al. 2018). Tomamos solamente los casos locales.

  • Utilizamos los datos sobre la incidencia diaria, el intervalo de serial (tiempo entre el inicio de los infectores y los infectados) y el número de reproductivo, que se mantiene constante, para simular trayectorias de epidemia plausibles y proyectar la incidencia futura. Se basa en un proceso de ramificación donde la incidencia diaria sigue un proceso de Poisson determinado por una infecciosidad diaria, calculada como:

\[\lambda_t \sim Pois \left ( \sum_{s=1}^{t-1} y_s w(t-s) \right ) \]

donde \(w()\) es la función de masa de probabilidad del intervalo serial, y \(y_s\) es la incidencia en el tiempo \(s\).

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.174   2.922   3.129   3.118   3.320   4.053

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.279   1.294   1.299   1.299   1.304   1.316

El \(R_0\) y la heterogeneidad de la epidemia

Habiendo hecho todos los calculos anteriores tenemos que aclarar que los análisis basados en el \(R_0\) (el número de reproducción básico, el número esperado de casos secundarios producida por un caso primario durante su período infeccioso en una población completamente susceptible (Kermack, McKendrick, and Walker 1927)) tienen una serie de susposiciones que no se cumplen (Hébert-Dufresne et al. 2020).Esto se puede razonar de la siguiente forma, el \(R_0\) nos dice el número de infecciones producidas por un caso pero ese numero promedio tiene una gran variación (Lloyd-Smith et al. 2005). Hay situaciones en las que se producen los eventos de super-propagación que están relacionadas con individuos que tienen mayor carga viral, o mayores contactos, o situaciones en las que se propicia la transmición (encuentros de muchas personas sin distancimiento ni protección). Es decir, puede ser engañoso mirar promedios provinciales o nacionales y celebrar si \(R_0\) parece estar cayendo por debajo de 1 porque la epidemia podría estar causando estragos en lugares deteminados o entre grupos particulares. Digamos que incluso si \(R_0\) está por debajo de 1 se pueden producir brotes grandes debido a la super-propagación o simplemente por casualidad.

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.10 - 0.18)

  • La tasa de crecimiento después el pico fue 0.05 (95% CI 0.0531 - 0.0465).

  • El tiempo de duplicación de la primer parte es es 5.0 días (95% CI 3.9 - 6.8 días)

  • El tiempo de duplicación de la segunda parte 13.9 días (95% CI 13.1 - 14.9 días).

Proyecciones de Incidencia para CABA

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.547   1.900   2.024   2.037   2.142   2.492

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.292   1.325   1.331   1.332   1.340   1.365

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA a partir de Datos Abiertos

Número total de casos al 2020-07-03 = 29611

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.11 - 0.18)

  • La tasa de crecimiento después el pico fue 0.05 (95% CI 0.0535 - 0.0463).

  • El tiempo de duplicación de la primer parte es es 4.9 días (95% CI 4.0 - 6.3 días)

  • El tiempo de duplicación de la segunda parte 13.9 días (95% CI 12.9 - 15.0 días).

Estimación de \(R_t\) y tiempo de duplicación para Prov. de Buenos Aires

  • Utilizamos los reportes del Ministerio de Salud. La linea punteada marron vertical es el primer pico de casos local para separar la 1ra fase, de 2da fase. Las lineas rojas es el inicio de la quarentena y las fases del gobierno nacional.

  • Luego estimamos modelos log-lineales

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.15 (95% CI 0.093 - 0.21)

  • La tasa de crecimiento después el pico fue 0.05 (95% CI 0.0526 - 0.047).

  • El tiempo de duplicación de la primer parte es es 4.6 días (95% CI 3.3 - 7.5 días)

  • El tiempo de duplicación de la segunda parte 13.9 días (95% CI 13.2 - 14.7 días).

Calculo de Proyecciones de Incidencia para Prov. De Buenos Aires

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.442   2.015   2.126   2.171   2.332   3.100

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.299   1.325   1.332   1.332   1.339   1.362

Estimación de \(R_t\) por provincia

  • Utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

Chaco: Gran resistencia

fallecido fecha n porMillon
NO 2020-07-02 1869 4782
SI 2020-07-02 91 233

Comparación de datos de Incidencia (nro. de casos por día) por Provincia

  • Inicialmente utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

  • Los datos cargados a partir de los reportes del Ministerio de Salud, tienen diferencias con los “Datos abiertos del Ministerio de Salud” en este último caso utilizamos las fechas de diagnóstico y la provincia de residencia, cuando lar provincia de residencia está SIN ESPECIFICAR se toma la provincia de carga.

residencia_provincia_nombre fecha Abiertos Reportes
Buenos Aires 2020-07-02 36620 35045
CABA 2020-07-02 29484 28783
Chaco 2020-07-02 2208 2172
Chubut 2020-07-02 147 136
Neuquén 2020-07-02 528 503
Río Negro 2020-07-02 917 911

Parámetros a partir de Datos Abiertos por Provincia

  • Arreglo provicia de residencia SIN ESPECIFICAR asumiendo provincia de carga
  • Fallecidos sin fecha de hospitalización asumo que fueron hospitalizados.
  • Calculo de días de hospitalización solamente para los fallecidos.
  • Dias pre-hospitalización: desde inicio de síntomas hasta hospitalización.
Tabla 1: Fallecidos sin fecha de hospitalización con respecto a Casos
residencia_provincia_nombre edad n Porcentaje
Buenos Aires 77.0 173 26.25
CABA 81.5 73 13.30
Río Negro 74.0 13 31.71
Córdoba 74.0 9 24.32
Chaco 70.5 6 5.77
La Rioja 83.0 4 44.44
Chubut 45.0 1 100.00
Neuquén 62.0 1 7.69
Tabla 2: TOTAL: Fallecidos sin fecha de hospitalización con respecto a Casos
edad n Porcentaje
78 280 19.49
Tabla 3: Proporcion Fallecidos con respecto a hospitalizados
residencia_provincia_nombre edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
Buenos Aires 73.0 7.0 days 2.0 days 486 7.47
CABA 76.0 9.0 days 2.0 days 476 6.48
Chaco 66.0 6.0 days 5.0 days 98 37.55
Córdoba 80.0 14.5 days 3.0 days 28 21.71
Río Negro 69.0 7.5 days 1.0 days 28 7.31
Neuquén 70.5 5.5 days 1.5 days 12 4.00
Mendoza 74.0 7.0 days 4.5 days 10 5.75
La Rioja 65.0 8.0 days 3.0 days 5 33.33
Santa Fe 67.0 10.0 days 4.0 days 5 7.25
Tucumán 63.5 9.0 days 3.0 days 5 26.32
Misiones 54.5 4.5 days 2.0 days 2 6.90
Jujuy 52.0 16.0 days 6.0 days 1 50.00
Tierra del Fuego 79.0 23.0 days 1.0 days 1 14.29
Tabla 4: TOTAL: Proporcion Fallecidos con respecto a hospitalizados
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 42 NA 2 days 14228 92.48
SI 74 8 days 2 days 1157 7.52
Tabla 5: Proporción Hospitalizados con respecto a casos
residencia_provincia_nombre edad n Porcentaje
CABA 43.0 7349 24.82
Buenos Aires 45.0 6502 17.62
Río Negro 42.0 383 41.01
Neuquén 37.0 300 56.50
Chaco 58.0 261 11.82
Mendoza 37.5 174 94.57
Córdoba 71.0 129 19.11
Entre Ríos 39.5 78 24.45
Santa Fe 60.0 69 16.08
Misiones 50.0 29 70.73
Salta 37.0 24 58.54
Santa Cruz 51.0 23 43.40
Tucumán 32.0 19 23.46
La Rioja 54.0 15 16.30
San Luis 37.0 8 72.73
Tierra del Fuego 50.0 7 5.11
Chubut 62.0 5 3.38
San Juan 44.0 5 62.50
Jujuy 46.5 2 1.34
Corrientes 85.0 1 0.85
La Pampa 71.0 1 14.29
Santiago del Estero 29.0 1 3.85
Tabla 6: TOTAL Proporción Hospitalizados con respecto a casos
edad n Porcentaje
44 15385 21.14
Tabla 7: Letalidad Proporción Fallecidos con respecto a casos
residencia_provincia_nombre n Porcentaje
Buenos Aires 659 1.79
CABA 549 1.85
Chaco 104 4.71
Río Negro 41 4.39
Córdoba 37 5.48
Neuquén 13 2.45
Mendoza 10 5.43
La Rioja 9 9.78
Santa Fe 5 1.17
Tucumán 5 6.17
Misiones 2 4.88
Chubut 1 0.68
Jujuy 1 0.67
Tierra del Fuego 1 0.73
Tabla 8: TOTAL Letalidad Proporción Fallecidos con respecto a casos
fallecido n Porcentaje
SI 1437 1.97
Tabla 9: TOTAL: Proporcion Cuidado Intensivo con respecto a hospitalizados
cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 42 8.0 days 2 days 13757 89.42
SI 63 8.5 days 3 days 1628 10.58
Tabla 10: TOTAL: De Hospitalizados cuantos Fallecen y fueron a Cuidado Intensivo, o no
fallecido cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO NO 41 NA 2 days 13206 92.82
NO SI 59 NA 3 days 1022 7.18
SI NO 79 8.0 days 1 days 551 47.62
SI SI 69 8.5 days 3 days 606 52.38
Tabla 11: TOTAL: De Cuidado intensivo cuantos Fallecen
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 59 NA 3 days 1044 63.04
SI 69 8.5 days 3 days 612 36.96

Bibliografía

Cori, Anne, Neil M. Ferguson, Christophe Fraser, and Simon Cauchemez. 2013. “A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics.” American Journal of Epidemiology 178 (9): 1505–12. doi:10.1093/aje/kwt133.

He, Xi, Eric H. Y. Lau, Peng Wu, Xilong Deng, Jian Wang, Xinxin Hao, Yiu Chung Lau, et al. 2020. “Temporal Dynamics in Viral Shedding and Transmissibility of COVID-19.” Nature Medicine, April. Nature Publishing Group, 1–4. doi:10.1038/s41591-020-0869-5.

Hébert-Dufresne, Laurent, Benjamin M. Althouse, Samuel V. Scarpino, and Antoine Allard. 2020. “Beyond R0: Heterogeneity in Secondary Infections and Probabilistic Epidemic Forecasting,” April. http://arxiv.org/abs/2002.04004.

Kermack, William Ogilvy, A. G. McKendrick, and Gilbert Thomas Walker. 1927. “A Contribution to the Mathematical Theory of Epidemics.” Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character 115 (772). Royal Society: 700–721. doi:10.1098/rspa.1927.0118.

Li, Qun, Xuhua Guan, Peng Wu, Xiaoye Wang, Lei Zhou, Yeqing Tong, Ruiqi Ren, et al. 2020. “Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia.” New England Journal of Medicine 382 (13). Massachusetts Medical Society: 1199–1207. doi:10.1056/NEJMoa2001316.

Lloyd-Smith, J. O., S. J. Schreiber, P. E. Kopp, and W. M. Getz. 2005. “Superspreading and the Effect of Individual Variation on Disease Emergence.” Nature 438 (7066, 7066). Nature Publishing Group: 355–59. doi:10.1038/nature04153.

Nouvellet, Pierre, Anne Cori, Tini Garske, Isobel M. Blake, Ilaria Dorigatti, Wes Hinsley, Thibaut Jombart, et al. 2018. “A Simple Approach to Measure Transmissibility and Forecast Incidence.” Epidemics 22 (March): 29–35. doi:10.1016/j.epidem.2017.02.012.

Thompson, R. N., J. E. Stockwin, R. D. van Gaalen, J. A. Polonsky, Z. N. Kamvar, P. A. Demarsh, E. Dahlqwist, et al. 2019. “Improved Inference of Time-Varying Reproduction Numbers During Infectious Disease Outbreaks.” Epidemics 29 (December): 100356. doi:10.1016/j.epidem.2019.100356.